✿資料探勘是什麼呢?
資料探勘(Data Mining)是從大量數據中自動發現有價值的模式、趨勢和知識的過程。此模式能夠自動發現、分析、提取有價值信息和知識,以利分析師做出預測、優化流程、探索出隱藏模式等過程。
✿資料探勘的技術
資料探勘的技術學習可以分為依據過去資料的預測能力與探索分析以發掘的過程模式。
以下是依據過去資料的預測能力說明:
1.機器學習裡的決策樹
機器學習中的決策樹是一種樹狀結構,用層級式分支,它會根據特約順序或特定問題來協助推論出決定,又稱分類樹。其中每個節點代表一個屬性測試,每個邊代表測試結果的分支。
透過這種樹狀結構,模型可以根據輸入數據的特徵來預測或分類輸出。
決策樹的工作方式如下:
優點:易於解釋和理解,可以處理混合數據類型,不需要對特徵進行標準化,並且能夠自動選擇重要的特徵。
缺點:容易過度擬合,且對特徵尺度敏感無法處理連續性特徵,也不適用過於復雜的問題。
2.機器學習裡的類神經網路學習
由大量互相連結的處理元素,由神經元所組成的,以多層次的架構來接收輸入、處理與輸出,訓練神經元需要龐大的資料。
3.機器學習裡的統計迴歸
統計迴歸可用於預測一個或多個輸出變數(稱為依變數或目標)與一個或多個輸入變數(稱為自變數或特徵)之間的關係。這種關係可以是線性或非線性的,具體取決於迴歸模型的類型。
其類型常使用的有 ↴
簡單迴歸:1個獨立變數與1個因變數
複迴歸:n個獨立變數與1個因變數
羅吉斯迴歸:可處理類別型的因變數與1個或m個獨立變數之間的關係
魔鬼藏在細節裡,魔法藏在你手裡。
妥善運用魔法,相信寶藏就在你的眼前,一起長成寶藏獵人吧!